Apprentissage de métrique appliqué à la classification de textes par méthodes à noyaux
نویسندگان
چکیده
Résumé – Dans cet article, nous proposons une méthode pour l’optimisation de la métrique d’un classifieur textuel à noyaux. Contrairement aux techniques populaires existantes, notre approche ne nécessite pas la définition explicite de règles sémantiques. Etant donné un ensemble d’apprentissage, l’algorithme proposé permet d’optimiser la matrice sémantique, sans qu’il soit nécessaire d’exhiber celle-ci. Les résultats expérimentaux montrent l’efficacité et l’utilité de la méthode proposée en classification de textes par SVM (Support Vector Machines).
منابع مشابه
Apprentissage: cours 2 Méthodes par moyennage local - Consistance des méthodes par partition
On considère la régression au sens des moindres carrés avec des entrées dans X = R et des sorties réelles bornées : Y = [−B,B] pour B > 0 et `(y, y′) = (y − y′)2. Une fonction cible est donc f(x) = E[Y |X = x]. On considère un ensemble d’entrâınement Dn = {(X1, Y1), . . . , (Xn, Yn)}. Principe des méthodes par moyennage local : Prédire par la moyenne pondérée des Yi pour des Xi voisins de x. On...
متن کاملMéthodes à noyaux appliquées aux textes structurés
Résumé. Cet article ébauche un état de l’art sur l’utilisation des noyaux pour le traitement des données structurées. Les applications modernes de la fouille de données sont de plus en plus confrontés à des données structurées, notamment textuelles. Les algorithmes d’apprentissage doivent donc être capables de tirer parti des informations apportées par la structure, ce qui pose d’intéressants p...
متن کاملL'universite Du Quebec a Chicoutimi Comme Exigence Partielle De La Maitrise En Informatique Offerte À L'université Du Quebec À Chicoutimi Par
متن کامل
Proposition d’un cadre méthodologique d’évaluation des systèmes d’assistance à la saisie de textes : Applications aux systèmes Sibylle et VITIPI
1 Pendant son post-doctorat à l’IRIT Résumé : Après un rappel sur les besoins des systèmes d’aide à la saisie de texte pour les personnes handicapées, cet article pose le problème de leur évaluation. En effet, si plusieurs de ces systèmes existent au niveau de la recherche, tous sont évalués dans des cadres, sur des textes et avec des métriques différentes. C’est pourquoi, après un bref passage...
متن کاملFiltrage bayésien de la récompense
Résumé : Une large variété de schémas d’approximation de la fonction de valeur a été appliquée à l’apprentissage par renforcement. Cependant, les approches par filtrage bayésien, qui se sont pourtant montrées efficaces dans d’autres domaines comme l’apprentissage de paramètres pour les réseaux neuronaux, ont été peu étudiées jusqu’à présent. Cette contribution introduit un cadre de travail géné...
متن کامل